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机 器 学 习 在 自 闭 症 儿 童 早期 识别 和 诊断 领域 的 应 用 
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摘 要 旱 发 现 、 早 诊断 、 早 干预 是 开展 自 闭 症 儿 童 教育 康复 工作 的 共识 , 但 传统 识别 和 诊断 方法 局 限 及 专 
业 人 员 缺 乏 常 导致 自 亲 症 儿 童 错失 最 佳 干预 期 。 为 改善 现状 ， 近 年 来 机 器 学 习 赁 借 其 客观 准确 、 简 便 灵 活 等 
方面 的 优势 ,逐渐 被 应 用 到 自 闭 症 的 早期 预测 、 筛 查 、 诊 断 和 评估 过 程 管 理 中 ， 积 累 了 较为 丰富 的 成 果 。 但 是 
机 器 学 习 也 在 研究 对 象 选取 、 分 类 数据 采集 和 理论 模型 应 用 等 方面 存在 局 限 性 。 未 来 研究 应 推动 构建 孕 产 期 
和 新 生 儿 病理 生理 信息 追踪 数据 库 和 标准 化 模型 分 类 指标 体系 ,同时 继续 优化 算法 ， 加快 智能 化 自 闭 症 识别 


和 诊断 理论 成 果 向 实践 转化 。 


关键 词 。 机 器 学 习 ， 自 闭 症 , 早期 识别 与 诊断 ， 系 统 4 
FHS R395 
1 引言 


随 着 智能 时 代 的 到 来 ,， 人工 智能 (Artificial 
Intelligence，AD 与 特殊 教育 的 深度 融合 已 经 成 为 
教育 发 展 的 重要 趋势 ( 郭 利明 等 , 2019)。 众 多 研 
究 者 致力 于 将 人 工 智 能 技术 与 不 同类 型 、 不 同 障 
碍 程度 特殊 教育 需要 儿童 的 需求 相 匹 配 ， 为 他 们 


提供 更 具 个 性 化 、 精 准 化 的 教育 康复 与 医疗 诊治 
服务 ， 进 一 步 改善 其 生活 和 学 习 质 量 。 随 着 技术 


的 不 断 成 熟 ， 自 闭 症 谱系 障碍 (Autism Spectrum 
Disorders，ASD) 这 一 数量 庞大 、 病 因 复 杂 群 体 受 


综述 


2002 年 的 1/150 相 比 ， 患 病 率 增加 了 近 240.9% 
(Maenner et al., 2021)。 面 对 不 断 攀 升 的 患 病 率 和 
尚 不 明确 的 发 病 机 制 ， 自 闭 症 已 演变 成 为 全 球 性 
重大 公共 卫生 问题 。 积 极 开展 早期 预防 、 识 别 和 
干预 是 应 对 这 一 挑战 的 重要 举措 。 然 而 目前 很 少 
有 专门 面向 ASD 群体 的 大 范围 患 病 风险 第 查 ， 
ASD 诊断 也 主要 依靠 外 在 的 行为 观察 与 评估 人 员 
的 主观 经 验 判 断 。 常 规 诊断 流程 是 评估 人 员 依 据 
标准 化 诊断 工具 (如 Diagnostic and Statistical Manual 
of Mental Disorders - 4/5th ed., DSM-IV/DSM-V; 
International Classification of Diseases, ICD)X} JL 


到 了 智能 教育 界 的 广泛 关注 ， 围 绕 为 自 闭 症 实 施 


讨 ， 其 中 科学 准确 的 早期 识别 和 诊断 作为 教育 干 
预 开展 的 前 提 , 不 可 避免 地 成 为 了 研究 与 实践 中 
必须 面 对 和 亚 待 解决 的 关键 问题 。 

根据 美国 疾病 预防 和 控制 中 心 数 据 显 示 ，2021 
年 自 闭 症 谱系 障碍 的 发 病 率 为 1/44, 与 2000~ 
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童 进行 评定 ,评定 方式 包括 心理 和 教育 测量 、 医 
学 检查 、 家 长 或 监护 人 访谈 、 日 常 观 察 等 ， 操 作 
费时 ， 对 于 评 佑 人员 具有 极 高 的 专业 理论 知识 和 
临床 经 验 要 求 。 但 现实 情况 是 ， 国 内 具备 诊断 资 
质 的 专业 人 员 非 常 少 ,即使 是 在 特殊 教育 发 展 相 


对 靠 前 的 一 些 国 家 ， 如 美国 ,能够 进行 ASD 诊断 
的 儿科 医生 也 仅 占 全 体 医 生 8% 的 比例 ( 陈 顺 森 


尽 


~ 


等 , 2011), 专业 诊断 “一 号 难 求 "。 有 研究 显示 ， 
管 自 闭 症 儿童 的 行为 症状 早 在 1~2 岁 就 能 表现 出 
来 , 但 典型 自 闭 症 诊 断 的 平均 年 龄 却 在 4 岁 以 后 ， 
轻 度 自 闭 症 的 诊断 年 龄 在 5.6~8.6 岁 (Sheldrick et 
al., 2017), 高 功能 自 闭 症 甚至 要 延迟 到 11 岁 以 后 
(Guinchat et al., 2012)， 儿 童 被 迫 陷入 “等 待 失 败 ” 


AN 


:202303.09799v1 
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的 痛苦 中 。 男 外 这 种 完全 基于 外 在 行为 的 、 主 观 
的 诊断 纳入 的 参考 变量 有 限 ,缺乏 客观 一 致 的 神 
ZAR SB, RIE. Wie A AA (Klin et al., 
2000), 一 部 分 儿童 被 错误 地 贴 上 了 自 闭 症 的 标签 ， 
严重 违背 了 评估 诊断 的 初衷 。 最 令 人 担忧 的 是 ， 
这 些 问题 会 严重 阻碍 自 闭 症 患 者 早期 干预 ,延误 
教育 康复 的 黄金 时 段 , 给 自 闭 症 儿 童 及 其 家 庭 带 
来 巨大 的 心理 和 经 济 负 担 。 最 后 ， 即 使 自 闭 症 儿 
童 诊断 完成 ,后续 基于 这 些 患 者 表现 进行 的 病 
因 、 症 状 研究 仍 属于 回溯 性 分 析 , 很 难 全 面 客观 
地 总 结 ASD 行为 特征 ,提取 可 表征 潜在 生理 机 制 
的 标记 物 ， 第 选 出 和 临床 预测 相关 度 比 较 高 的 特 
征 。 这 使 得 我 们 在 自 闭 症 儿童 防治 工作 中 一 直 处 
在 被 动 状 态 。 

机 器 学 习 (Machine Learning, ML) 作 为 人 工 智 
能 的 核心 ,是 一 类 从 数据 中 自动 分 析 获 得 规律 ， 
并 利用 规律 对 未 知 数据 进行 预测 的 技术 ( 余 明 华 
等 ,2017)。 该 技术 自动 生成 的 规则 不 受 个 体 主观 
经 验 的 影响 ， 对 于 提升 分 类 的 特异 性 、 敏 感性 、 
准确 性 和 增加 分 类 效率 都 具有 重要 意义 。 此 外 ， 
机 器 学 习 可 以 提取 大 量 数据 中 细微 的 、 潜 在 有 用 
的 信息 ,并 利用 这 些 信息 创建 一 个 针对 当前 问题 
的 预测 或 分 类 模型 ， 特 别 适用 于 洞察 复杂 问题 的 
内 在 规律 ， 帮助 尽早 发 现 可 能 病因 ， 提高 自 闭 症 
的 生活 质量 ( 崔 建 伟 等 ，2021; 李 航 ，2012; 
Hosseinzadeh et al., 2021)。 国 内 外 学 者 将 其 应 用 于 
多 种 精神 与 神经 系统 疾病 的 分 类 、 诊 断 、 治 疗 和 
预后 管理 中 , 在 自 闭 症 群体 的 预测 、 识 别 和 辅助 


数据 库 检 索 相 关 文 献 
(n=520) 


相关 文献 总 数 (n=570) 


ah RB 


其 他 资源 途径 (3| 文 筛选 ) 获 
取 文献 (n=50) 


诊断 实证 研究 中 也 取得 了 大 量 有 价值 的 成 果 , 但 
国内 在 该 方面 的 研究 报告 相对 较 少 。 本 文 就 机 器 
学 习 在 自 闭 症 儿 童 早期 识别 和 诊断 中 的 应 用 进行 
综述 ,以 期 为 国内 相关 研究 与 实践 提供 参考 。 


2 研究 方法 


采用 国际 上 广泛 使 用 的 系统 性 文献 综述 和 元 
分 析 方 法 (Preferred Reporting Items for Systematic 
reviews and Meta-Analyses, PRISMA) 来 确定 纳入 
研究 的 论文 构成 。 该 方法 包括 4 个 文献 筛选 阶段 ， 
共计 27 条 综述 项 目 。4 个 阶段 分 别 为 检索 、 初 筛 、 
纳入 和 综合 ,综述 项 目 包 括 文献 标题 、 摘 要 、 研 
究 目 的 、 人 研究 方法 和 研究 结果 等 (Moher et al., 
2009)。 考 虑 到 近年 来 计算 机 科学 技术 发 展 迅 猛 ， 
更 新 换代 速度 极 快 ， 本 文选 取 近 5 年 来 机 器 学 习 
在 自 闭 症 儿童 早期 识别 和 诊断 领域 文献 ， 具 体检 
索 日 期 范围 为 2016 年 1 月 1 日 ~2021 年 4 月 29 
日 。 应 用 的 英文 主题 词 为 :“Autis”“Prediction” 
“Early Screening/ Early 


出 | 


Detection/ Early 
Identification/ Early Recognition” “Early Diagnosis” 
“Machine Learning/ Artificial Intelligence”, fE 
EBSCO, Elsevier Science Direct, SAGE, Web of 
Science, Springer 五 个 综合 性 外 文 数据 库 进行 检 
索 ， 限 定 检索 范围 为 同行 评议 (Peer-reviewed) 期 
刊 ， 获 得 520 篇 文献 ,通过 参考 文献 引文 检索 又 
获得 50 篇 文献 ， 共 计 570 篇 。 作 者 共同 阅读 文献 
的 标题 、 摘 要 及 正文 ,删除 重复 、 不 符合 既定 标准 
的 论文 ， 最 后 获取 纳入 综述 的 文献 60 篇 ( 见 图 1)。 


—| 剔除 重复 文献 (一 158) 


初 第 获取 文献 (n=412) 


非 英 文 实证 文献 (n=225) 


无 关 文献 (研究 对 象 非 儿 童 , 与 ASD 早 
期 分 类 无 关 , 未 采用 机 器 学 习 技术 ) 


(n=108) 
X| 。 机 可 学 习 应 用 于 自 闭 症 早期 识别 和 诊断 文献 -79) 研究 模 枯 文献 


(如 结论 无 明确 数据 支撑 )(n=19) 


| 


1 最 终 纳 入 文献 (n=60) 


图 1 PRISMA 文献 筛选 流程 图 


和 
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文献 纳入 标准 : (1) 文 献 为 英文 实证 期 刊 论文 
全 文 可 得 且 文 章 不 少 于 3 页 ; (2) 研 究 对 象 中 至 少 
包含 1 名 ASD 儿童 (在 本 文中 , 对 儿童 的 界定 参照 
国际 《儿童 权利 公约 》， 即 儿童 指 18 岁 以 下 的 个 
体 )， 且 具有 明确 的 被 试 统计 学 变量 (年 龄 ) 或 “ 儿 
童 " 标 注 2 (3) 研 究 包含 明确 的 研究 问题 、 方 法 和 结 
论 ， 研 究 结论 有 详实 的 数据 支撑 ; (4) 研 究 主 题 聚 
Æ ASD 儿童 的 早期 识别 或 诊断 ， 在 摘要 或 关键 词 
中 明确 表明 采用 机 器 学 习 技 术 进 行 分 类 。 排 除 标 
WE: () 非 英文 文献 (韩语 、 德 语 、 西 班 牙 语 等 )、 
综述 、 书 籍 章节 、 会 议 记 录 和 专利 等 文章 ， 以 及 
少 于 3 页 的 文章 ; 2) 研究 对 象 全 部 为 18 岁 以 上 的 
成 年 人 、 老 年 人 或 其 他 特殊 群体 ; (3) 研 究 问题 、 
人 研究 设计 或 研究 结论 模糊 不 清 ,， 结论 没 有 数据 支 
撑 ; (4) 与 ASD 无 关 的 精神 疾病 研究 以 及 未 应 用 机 
器 学 习 方 法 的 研究 。 这 些 标准 是 在 文献 搜索 之 前 
确定 的 ， 以 减少 在 文献 第 查 期 间 的 潜在 偏见 。 

最 后 ,基于 徐 建 平 和 张 厚 上 紧 (2005) 提 出 的 “ 归 
类 一 致 性 公式 ”检测 编码 信和 度 ， 由 前 两 位 作者 共同 
计算 出 纳入 综合 分 析 的 文献 评分 者 信和 度 在 0.50~1.00 
之 间 ， 总 的 归 类 一 致 性 为 0.812; 编码 信和 度 系 数值 
在 0.75~0.80 之 间 , 总 体 编码 信 度 系数 为 0.759, 
表明 研究 文献 具有 公平 到 良好 的 一 致 性 水 平 。 


3 基于 机 器 学 习 的 自 闭 症 早期 识别 和 
诊断 研究 数据 类 型 与 采集 


机 器 学 习 可 以 通过 对 已 有 数据 的 抽象 ， 发 现 
数据 的 隐藏 规律 ( 董 健 宇 等 ,2020)。 因 此 数据 是 


模型 建立 的 源头 性 因素 ， 建 模 的 第 一 步 就 是 数据 
收集 。 
3.1 ”数据 构成 

ASD 儿童 本 身 异 质 性 高 ,数据 结构 性 不 强 ， 
因此 分 类 模型 的 原始 数据 一 般 为 二 分 类 数据 。 从 
被 试 构成 看 , 研究 者 一 般 同时 设置 实验 组 和 对 照 
组 , 选取 ASD 及 与 其 生理 年 龄 、 智 力 年 龄 等 相 匹 
配 的 其 他 发 展 障碍 或 典型 发 展 儿 童 (typically 
developing, TD), 其 中 障碍 儿童 常见 类 型 有 注意 缺 陶 
多 动 障碍 (Attention Deficit Hyperactivity Disorder, 
ADHD)、 发 展 迟 缓 (Developmental Delay, DD). JL 


”作者 注 : 10 项 研究 中 被 坛 人 数 多 、 年 龄 跨度 大 ， 同 时 存 
在 儿童 与 成 年 被 试 , 无 法 做 严格 区 分 。 所 以 附 表 中 部 分 被 
试 年 龄 大 于 18 岁 。 


童 失 语 症 (Childhood Apraxia of Speech, CAS) 和 其 
他 神经 发 育 障碍 (Other neurodevelopmental disorder, 
OND), 也 有 研究 根据 儿童 未 来 患 自 闭 症 风险 的 程 
度 分 为 高 风险 (High Risk, HR) 和 低 风险 (Low Risk, 
LR) 组 。 从 被 试 年 龄 范围 看 ,涉及 个 体 发 展 的 各 个 
阶段 ， 筛 查 和 诊断 的 最 早 时 间 基 本 上 在 3 岁 以 内 ， 
处 于 婴儿 期 和 幼儿 期 阶段 。 自 闭 症 风险 预测 研究 
时 间 更 早 , 一 般 在 1 岁 之 前 ， 也 有 研究 提前 到 孕 
产 期 和 新 生 儿 时 期 , 但 这 类 研究 很 少 。 从 被 试 来 
源 看 ， 涉 及 美国 、 甘 国 、 法 国 、 中 国 、 伊 朗 、 新 
西 兰 、 印 度 、 意 大 利 、 韩 国 、 西 班 牙 、 澳 大 利 亚 
等 数 十 个 国家 和 地 区 ， 常 见 的 数据 采集 渠道 有 自 
闭 症 研究 公开 数据 库 ( 见 表 1)、 医 院 、 特 殊 教 育 学 
校 或 康复 中 心 和 少量 的 在 线 搜索 引擎 (如 雅虎 问 
答 ,谷歌 搜索 ) 等 。 不 同 研究 包含 的 样本 数量 差异 
很 大 ， 从 几 十 到 上 千 分 布 不 均 ， 其 中 样本 量 超 过 
300 人 的 研究 数据 基本 上 来 自 于 公开 数据 库 。 自 
闭 症 研究 公开 数据 库 是 研究 者 为 帮助 不 同学 科 、 
不 同 专业 工作 者 开展 合作 研究 设置 的 开放 资源 库 ， 
其 储存 的 大 规模 数据 为 使 用 机 器 学 习 开 展 自 闭 症 
识别 和 诊断 带 来 极 大 便利 。 以 使 用 频率 最 高 的 
ABIDE (Autism Brain Imaging Data Exchange ) 数 
据 库 为 例 , 该 数据 库 整 合 全 球 多 个 实验 室 收集 
ASD 和 TD 儿童 以 脑 结构 和 功能 影像 为 主 的 研究 
数据 ,免费 向 科研 人 员 提 供 ， 现 已 采集 完成 两 共 
数据 ， 被 试 数 量 超 过 2200 名 ,网 站 注册 研究 人 
员 涵 盖 北 美洲 、 了 欧洲、 非洲 、 亚 洲 等 多 个 国家 和 
地 区 。 


R1 自 闭 症 研究 公开 数据 库 
序号 中 文 名 称 英文 名 称 (简称 ) 
1 闭 症 脑 成 像 数 据 — Autism Brain Imaging Data 
交换 数据 库 Exchange (ABIDE) 
2 闭 症 遗 传 资源 交 Autism Genetic Resource 
换 数据 库 Exchange (AGRE) 
3 ”波士顿 自 闭 症 协 会 Boston autism consortium (AC) 
4 闭 症 治疗 网 络 Autism Treatment Network 


(ATN) 


Simons Simplex Collection 
(SSC) 


Simons Variation in Individuals 
Project (Simons VIP) 


5 SSC 数据 库 


6 Simons VIP 数据 库 


University of California Irvine 
Repository (UCI) 


7 加 州 大 学 欧文 分 校 
知识 库 
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机 器 学 习 技 术 的 运用 突破 了 传统 回溯 性 研究 
的 局 限 ， 自 闭 症 识别 和 诊断 的 年 龄 得 以 在 一 定 程 
度 上 缩短 , 通过 复杂 运算 提取 的 隐藏 规律 还 可 以 
被 应 用 到 孕 产 期 和 新 生 儿 检查 中 ,帮助 及 早 发 现 
HERR, 为 早期 干预 争 得 时 间 , 但 遗憾 的 是 目 
前 这 类 研究 并 不 多 见 。 除 此 之 外 ,机 器 学 习 技 术 
使 大 范围 、 多 指标 、 览 文化 数据 收集 成 为 可 能 ， 从 
独立 小 样本 数据 到 跨 地 区 的 自 财 症 公开 共享 数据 
库 ， 有 效 提高 了 研究 的 外 部 效 度 ， 也 为 更 深层 次 
自 闭 症 成 因 挖 气 和 成 功 预防 提供 依据 。 但 应 该 注 
意 的 是 ， 当 前 的 公开 数据 库 多 来 自 于 单位 或 个 人 
WIE, 数据 采 集 的 目的 和 标准 并 不 一 致 ， 样 本 信 
息 整 合 缺乏 同 质 性 , 训练 集 与 测试 集 之 间 可 能 出 
现 偏差 ， 模 型 的 推广 问题 还 需 进一步 验证 。 
3.2 ”数据 采集 

样本 选 定 后 就 可 以 启动 数据 采集 工作 。 近 年 
来 数据 采集 方式 和 类 型 因 技 术 更 新 而 更 为 多 样 ， 
例如 基于 脑 电 信号 和 成 像 技术 采集 生理 信号 数据 
(Nogay & Adeli, 2020; Pagnozzi et al., 2018)、 借 助 
量 表 和 观察 、 访 谈 、 眼 动 技 术 等 收集 行为 数据 
(Bone et al., 2015)。 机 器 学 习 识 别 和 诊断 是 基于 可 
以 反映 自 闭 倾向 的 特征 及 各 种 神经 标志 物 来 进行 
判断 ， 目 前 主要 有 年 龄 、 性 别 、 种 族 等 人 口 统计 
学 资料 目光 对 视 、 社 会 性 微笑 、 模 仿 等 典型 症 
状 表现 ， 儿 童 个 人 及 家 庭 病 史 等 临床 资料 ， 以 及 
功能 性 磁 共 振 成 像 、 结 构 性 磁 共 振 成 像 、 脑 电 图 、 
超声 波 等 生理 信号 数据 ( 见 表 2)， 以 及 不 同 数据 类 
型 组 合 而 成 的 多 模 态 数 据 。 


3.2.1 ”基于 影像 分 类 

基于 脑 成 像 、 超 声波 成 像 、 视 网 膜 成 像 等 生 
物 标记 作为 机 器 学 习 技 术 的 输入 特征 可 以 为 自 闭 
症 分 类 提供 客观 证 据 ， 因 此 在 研究 中 应 用 最 为 广 
ZZ (Abraham et al., 2017; Caly et al., 2021; Lai et al., 
2020)。fMRI 的 高 时 间 分 辨 率 有 助 于 对 大 脑 特定 
区 域 皮 层 活动 的 精准 定位 ssMRI 空 间 分 辩 率 较 高 ， 
能 够 客观 地 记录 不 同 个 体 相同 脑 组 织 成 分 间 的 差 
异 。 有 学 者 提出 自 闭 症 分 类 研究 中 同时 采用 这 两 种 
技术 效果 最 好 。 如 Rakić 等 (2020) 采 集 了 ABIDE-I 
数据 库 中 817 名 7~64 岁 被 试 sSMRI 和 静 息 态 fMRI 
(resting state fMRI, rs-fMRI) 影 像 ,通过 Fisher 算 
法 对 特征 向 量 (feature vectors) 降 维 ， 降 维 后 的 特 
征 向 量 作 为 分 类 器 的 输入 信息 ,最 后 采用 栈 式 自 
动 编码 器 和 多 层 感 知 机 算法 进行 识别 ， 准 确 率 最 
高 可 达 85.06%。Sen 等 (2018) 的 研究 也 发 现 同 时 
使 用 两 种 技术 作为 特征 输入 识别 ASD 和 TD 的 效 
果 最 佳 。 但 是 也 有 研究 显示 单独 采用 fMRI 或 
sMRI 的 影像 也 能 够 实现 自 闭 症 个 体 的 准确 识别 
(Eugenia et al., 2020; Katuwal et al., 2016; Plitt et 
al., 2015), Guo 等 2017) 收 集 了 ASD 和 TD 的 
rs-fMRI 数据 ,发 现 经 过 特征 选择 的 深度 神经 网 络 分 
类 准确 率 可 达 86.36%。 脑 电 造价 较 低 、 使 用 方便 ， 
可 以 为 自 闭 症 儿童 识别 提供 脑 神经 细胞 电 生 理 活 
动 反 应 证 据 。 有 研究 使 用 EEG 技术 实现 了 对 3 个 
月 月 龄 (Dickinson et al., 2020) 和 3~14 2 
(Abdolzadegan et al., 2020; Grossi et al., 2017) 自 闭 
症 儿童 识别 ,表现 良好 。 


表 2 基于 机 器 学 习 的 自 闭 症 识别 和 诊断 研究 数据 类 型 


一 级 维度 


具体 指标 


影像 


功能 性 磁 共 振 成 像 (functional Magnetic Resonance Imaging，fMRI), 结构 性 磁 共 振 成 像 (structural Magnetic 
Resonance Imaging, sSMRI), 脑 电 图 (electroencephalogram, EEG)， 超 声波 (ultrasonic, UT) 


闭 症 诊断 访谈 量 表 -修订 版 (Autism 


Diagnostic Interview 一 Revised，ADI-R), 精神 疾病 诊断 与 统计 手册 (DSM-IV/ DSM- 让 ,国际 疾病 分 类 (CD-710)， 


AOSD, 修订 版 婴 幼 儿 自 闭 症 检 核 表 (Modified 


Checklist for Autism in Toddlers, M-CHAT), 穆 林 早期 学 习 量 表 (Mullen Scales of Early Learning, MSEL), 文 兰 适 
应 行为 量 表 (Vineland Adaptive Behavior Scales, VABS), 社会 反应 量 表 (Social Responsiveness Scale, SRS), Á A] 
证 谱系 量 表 (Autism-spectrum Quotient-10, AQ-10)， 儿 童 行为 检 核 表 (Child Behavior Checklist, CBCL), 社交 沟通 


量 表 / 问 卷 闭 症 诊 断 观察 量 表 (Autism Diagnostic Observation Schedule, ADOS), 
FOIL A AVE WS at Fe (Autism Observational Scale for Infants, 
问卷 (Social Communication Questionnaire, SCQ), 家 长 问卷 
典型 行为 ”有 眼 动 行为 ,社会 行为 ,， 刻板 行为 , 姿势 控制 ， 上 上 肢 运动 等 
个 人 特征 ”父母 的 病史 信息 ,儿童 的 个 人 信息 (年 龄 、 性 别 、 惯 用 手 、 智 商 、 种 族 、 病 史 、 饮 食 、 睡 眠 等 ) 
其 他 DNA, RNA， 代 谢 物 ， 语 音 


3 作者 注 :在 传统 的 诊断 过 程 中 ,ADOS ADI-R, DSM-V, ICD-10 等 主要 用 于 


究 者 也 会 将 其 用 作 筛 查 指标 参数 ， 因 此 正文 未 做 明确 划分 。 


闭 症 临床 诊断 , 但 是 在 本 研究 参考 文献 中 ， 研 
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3.2.2 ”基于 量 表 / 问 卷 分 类 

传统 标准 化 测量 工具 汇聚 了 临床 专家 丰富 理 
论 知识 和 扎实 的 实践 经 验 ,， 是 自 财 症 儿 童 筛 查 和 
诊断 的 “ 金 标 准 ”， 可 以 为 机 器 学 习 模 型 构建 提供 
力 证 据 。 基 于 传统 测验 工具 进行 识别 和 诊断 的 
S 式 有 两 种 。 第 一 种 是 将 传统 标准 化 测验 所 得 结 
果 借 助 机 器 学 习 技 术 进 行 数据 分 析 ， 探究 分 类 准 
确 性 。Abbas 等 在 2018 和 2020 年 两 项 研究 中 均 
将 ADOS 和 ADI-R 中 常用 的 行为 模块 作为 分 类 器 
输入 信息 ， 提 出 了 一 种 基于 机 器 学 习 的 多 模块 自 
闭 症 评估 方法 。 该 方法 包含 3 个 模块 , 一 是 家 长 
问卷 , 二 是 儿童 家 庭 录 像 中 标记 的 关键 行为 ， 三 
是 临床 问卷 。 通 过 随机 森林 、L2 正则 化 逻辑 回归 
和 梯度 提升 决策 树 对 18~72 个 月 的 儿童 进行 分 类 ， 
发 现 当 同时 使 用 模块 一 和 二 ， 并 设置 不 确定 性 结 
果 变 量 (Inconclusive Results Variant, < 25%) 时 , 分 
类 准确 率 高 于 98%， 三 模块 联合 时 准确 性 达 92%。 
即使 是 三 模块 共用 , 测试 总 时 长 也 仅 在 15 分 钟 左 
右 。 也 有 研究 者 基于 AQ-10 (儿童 /青少年 /成 人 版 ) 
和 幼儿 自 闭 症 量化 检 核 表 (Quantitative checklist 
for autism in Toddlers, Q-CHAT), 设计 移动 第 查 程 
序 ASD Tests (Thabtah，2019) 和 Autism AI 
(Shahamiri & Thabtah, 2020) 对 自 闭 症 儿 童 进行 预 
W, ASD Tests 识别 准确 率 最 高 可 达 99.85%， 时 间 
仅 需 3~5 分 钟 。 

第 二 种 是 机 器 学 习 算 法 通过 对 传统 标准 化 量 
表 或 问卷 的 项 目 删 减 ， 筛 选 出 最 具 代 表 性 的 问题 
构建 分 类 器 (Levy et al., 2017), 40 Duda, Daniels 
和 Wall (2016) 通 过 俱 辑 回归 等 算法 发 现 ， 当 从 
ADI-R 的 93 个 条 目 中 筛选 出 7 个 关键 项 目 或 单独 
选用 ADOS 第 2. 3 维度 作为 分 类 依据 时 ， 对 自 闭 
症 儿 童 分 类 准确 率 达 到 了 99%, 测试 时 间 缩 短 到 
十 几 分 钟 。Duda 和 Ma 等 (2016) 以 及 Duda 等 (2017) 
还 以 SRS 量 表 中 的 5 种 典型 行为 和 15 个 衍生 问 
题 构建 分 类 器 ， 分 类 性 能 均 达 到 预期 (AUC > 93%， 
AUC = 89%)。 值 得 注意 的 是 ， 近 一 半 基 于 量 表 分 
类 的 文献 是 同时 采用 两 种 或 两 种 以 上 工具 , 希望 
通过 不 同 测验 的 融合 ， 获 得 更 佳 分 类 效果 。 
3.2.3 ”基于 行为 分 类 

自 闭 症 儿童 典型 行为 表现 在 发 展 早期 就 可 以 
直接 观测 到 ， 可 以 为 分 类 模型 构建 提供 外 显 指 
标 。 社交 障碍 和 重复 刻板 行为 是 ASD 诊断 的 核心 
标准 ， 可 作为 行为 指标 分 类 的 重要 依据 。Qiu 等 


(2020) 采 用 静态 面孔 范式 (Still-Face Paradigm, 
SFP) HR-ASD 和 TD 非 社会 性 /社会 性 微笑 、 反 
抗 行为 、 目 光 交 流 和 积极 社交 参与 的 频率 和 持续 
时 间作 为 模型 分 类 指标 。Negin 等 (2021) 构 建 了 
HR-ASD 儿童 扩展 性 刻板 行为 数据 库 (Expanded 
Stereotype Behavior Dataset, ESBD), 通过 旋转 、 
拍打 手臂 、 手 部 动作 和 头 部 撞击 4 个 动作 实现 与 
TD 的 区 分 。 眼 动 仪 可 以 记录 人 在 处 理 视觉 信息 时 
的 眼 动 轨迹 特征 ， 眼 动 行为 是 基于 机 器 学 习 进 行 
自 闭 症 分 类 的 最 常用 行为 指标 , 具体 指标 包括 注 
视 时 长 和 注视 频率 。Wan 等 (2019) 采 用 SMI 
RED250 便携 式 眼 动 跟踪 系统 ， 记 录 4~6 岁 的 
ASD 和 TD 在 观看 一 段 10 秒 钟 的 女性 演讲 视频 时 
对 不 同 身体 部 位 的 注视 时 长 ， 并 采用 支持 向 量 机 
构建 分 类 器 ， 发 现 儿 童 对 演讲 者 口 部 和 身体 的 注 
视 时 长 差异 可 以 有 效 区 分 ASD 和 TD (Acc- = 
85.1%, Sen- = 86.5%, Spe- = 83.8%)。 除 此 之 外 ， 部 
分 自 闭 症 群体 存在 运动 障碍 ， 有 研究 显示 姿势 控 
制 和 上 歧 运 动 等 指标 也 可 以 作为 早期 分 类 的 依据 ， 
其 应 用 准确 性 可 以 达到 90% 以 上 (Li et al., 2020; 
Wedyan et al., 2019)。 
3.2.4 ”基于 多 模 态 数据 分 类 

“多 模 态 ”是 指 表征 意义 的 符号 系统 或 有 效 手 
段 的 多 样 性 ( 顾 日 国 , 2013), 多 模 态 数据 则 是 指 混 
合 多 种 分 类 方法 、 分 类 指标 实现 研究 目的 ,在 本 
研究 中 则 指 将 量 表 、 影 像 、 行 为 等 单一 模 态 的 数 
据 采 集 方 式 进行 整合 ， 同 时 采用 两 种 或 两 种 以 上 
方法 用 于 自 闭 症 分 类 模型 构建 (Geng et al., 2020)。 
Kang 等 (2020) 收 集 3~6 岁 ASD 和 TD 的 rs-fMRI 
数据 和 对 本 民族 和 其 他 种 族人 类 面孔 反应 的 眼 动 
指标 ， 结 合 支 持 向 量 机 的 最 小 宛 余 - 最 大 相关 
(minimum redundancy maximum relevance, MRMR) 
特征 选择 方法 对 被 试 进行 分 类 ,发 现 脑 电 和 了 眼 动 
数据 同时 作为 分 类 器 数值 输入 时 ， 分 类 准确 率 达 
到 85.44%, AUC 超过 93%， 远 高 于 仅 依 照 单 一 行 
为 指标 分 类 66.9% 的 准确 率 。Bosl 等 (2018) 纵 向 追 
踪 高 低 风 险 ASD 在 3~36 个 月 间 的 脑 电 数 据 , 在 
36 个 月 时 采用 ADOS 测量 参与 者 的 自 闭 症 症状 严 
重 程 度 ,， 结 果 发 现 3 个 月 大 婴儿 的 脑 电 数据 可 以 预 
测 其 3 岁 时 的 ADOS 得 分 。 韩 保 祯 (2018) 也 发 现 多 
模 态 信息 融合 的 脑 网 络 数据 对 于 ASD 和 TD 分 类 
效果 最 好 。 

机 器 学 习 应 用 于 自 闭 症 早期 分 类 研究 数据 类 
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型 从 单一 模 态 扩展 到 多 模 态 ， 分 类 指标 类 型 越 来 
越 多 样 ; 采集 方法 从 外 显 的 行为 指标 到 内 部 神经 
标记 ， 技 术 也 愈 发 客观 全 面 。 数 据 采 集 方式 和 类 
型 的 丰富 可 以 在 源头 上 助力 模型 构建 ， 为 最 佳 分 
类 效果 的 获得 提供 基础 。 但 我 们 也 应 该 看 到 ， 目 
前 数据 采集 还 存在 几 个 问题 需要 改善 ,首先 影像 
技术 手段 比较 单一 ， 主 要 是 fMRI 和 sMRI, ERP, 
fNIRS 等 技术 在 该 领域 的 应 用 较 少 ,其 次 , 传统 诊 


Cognitive Map, MFCM), ASD-DiagNet 和 规则 性 
机 at 3 “J (Rules-Machine Learning, RML) 等 
(Eslami et al., 2019; Feczko et al., 2017; Goel et al., 
2020; Puerto et al., 2019; Thabtah & Peebles, 
2019)。 但 近年 来 随 着 技术 的 不 断 发 展 ， 人 工 神 经 
网 络 (Artificial Neural Network, ANN) 、 卷 积 神经 
网 络 (Convolutional Neural Network, CNN)、 深 度 
神经 网 络 (Deep Neural Networks, DNN)、 前 馈 神 经 


断 工具 本 身 是 经 过 系统 设计 的 ,每 个 模块 有 固定 
目的 , 不 同 机 器 学 习 方法 中 对 于 项 目 或 模块 删 减 
标准 不 一 , 得 到 的 结果 并 不 统一 , 工具 删 减 的 依 
据 和 标准 缺乏 规范 性 讨论 。 传 统 工具 测量 时 长 是 
为 了 保证 施 测 过 程 更 为 细致 准确 ,机 器 学 习 将 时 
间 缩 短 到 十 几 分 钟 ， 是 否 有 可 能 出 现 信息 遗漏 导 
致 结果 偏差 也 是 一 大 问题 。 最 后 ， 基 于 典型 行为 
的 分 类 指标 过 于 广泛 , 基于 DNA. RNA 等 遗传 物 
质 的 研究 却 并 不 多 见 , 不 同 研究 者 关注 的 重点 有 
很 大 差异 ， 如 何在 众多 指标 中 选 出 最 具 代 表 性 的 
一 种 或 几 种 指标 仍然 值得 商 榨 。 这 些 都 是 我 们 在 
应 用 机 器 学 习 实 现 自 闭 症 分 类 之 前 需要 广泛 探讨 
和 论证 的 问题 。 只 有 真正 解决 源头 性 问题 ， 才 有 
可 能 将 技术 的 优势 真正 落实 在 自 闭 症 群体 身上 。 


4 ”基于 机 器 学 习 的 自 闭 症 早期 识别 和 
诊断 研究 算法 与 流程 


41 机 器 学 习 算法 

算法 是 模型 建立 的 技术 性 要 素 。 机 器 学 习 算 
法 的 分 类 非常 广泛 (Hyde et al.，2019), 基于 学 习 
方式 不 同 可 分 为 有 监督 学 习 、 无 监督 学 习 、 半 监 
督学 习 和 强化 学 习 ， 按 照 模型 结构 的 深度 又 分 为 
传统 机 器 学 习 和 深度 学 习 。 目 前 在 自 闭 症 早期 识 
别 中 的 应 用 以 传统 算法 为 主 , 包括 支持 向 量 机 
(Support Vector Machine, SVM)、 决 策 树 (Decision 
Tree, DT). K 最 近邻 (K-Nearest Neighbours, 
KNN) 、 朴 素 贝 叶 斯 (Naive Bayes, NB), 归 
(Regression), 、 随 机 森林 (Random Forest，RF) 和 榜 
度 提升 决策 树 (Gradient Boosted Decision Trees, 
GBDT) 等 (Ben-Sasson & Yom-Tov, 2016; Meera et 
al., 2020; Parikh et al., 2019)。 一 些 改 进 算法 也 有 
使 用 但 数量 不 多 ， 如 功能 性 随机 森林 (Functional 
Random Forest, FRF). 、 改 进 的 蝗虫 优化 算法 
(Modified Grasshopper Optimization Algorithm, 
MGOA) 、 多 层 模 糊 认 知 图 (Multilayer Fuzzy 


网 络 (Feedforward Neural Network, fNN) 和 Z JER 
知 机 (Multilayer Perceptrons，MLP) 等 深度 学 习 新 
方法 也 逐渐 受到 了 研究 者 的 关注 (Achenie et al., 
2019; Eni et al., 2020; Raj & Masood, 2020)。 

SVM 是 传统 机 器 学 习 代 表 性 算法 之 一 ， 特 别 
适用 于 二 分 类 数据 问题 (Jun et al., 2019; Li et al., 
2018; Rrtico et al., 2016)。Liu 等 (2016) 的 研究 采用 
12 [nl SEK PR BL(Radial Basis Function kernel, RBF 
kernel) 将 非 线 性 数据 投影 到 高 维 空间 ,使 数据 实 
现 分 离 ， 有 效 区 分 了 ASD 和 TD, 准确 率 达 
88.51%。 但 有 研究 显示 ，SVM 等 传统 算法 往往 直 
接 根据 特征 对 样本 进行 分 类 ,不 进行 或 只 进行 一 
次 特征 变换 和 选择 ,过 于 依赖 上 游 提 供 的 特征 ， 
存在 对 缺失 数据 敏感 和 多 分 类 问题 处 理 过 拟 合 问 
题 ， 在 面 对 自 闭 症 这 一 成 因 和 表现 复杂 群体 时 ， 
效果 存在 局 限 (Namdeo & Singh, 2021; 杨 剑 锋 等 ， 
2019)。 深 度 学 习 无 需 借 助 上 游 特征 ， 可 以 将 大 量 
原始 数据 直接 输入 模型 ， 通 过 对 数据 的 多 次 变换 
检测 计算 出 抽象 特征 帮助 分 类 ( 胡 越 等 ，2019)， 
模型 的 分 类 性 能 和 泛 化 能 力也 较 传统 方法 有 所 改 
善 (Dubreuil et al., 2020; Li et al., 2019; Quaak et 
al.，2021)。Salari 等 (2019) 以 及 Sewani 和 Kashef 
(2020) 以 rs-fMRI 数据 为 分 类 指标 , 运用 SVM, 
KNN, RF 和 CNN 分 别 构建 分 类 器 ， 发 现 CNN 
(70.22%; 84.05%) 的 分 类 准确 率 高 于 SVM (69.35%; 
69.1%), KNN (62.11%; 60.1%) 和 RF (59.94%; 
65.3%)。Dong 等 (2021) 以 静 息 态 脑 电 图 为 分 类 指 
标 构 建 的 CNN 模型 , 分 类 准确 率 更 是 达到 了 
92.63%。Yang (2020) 的 研究 也 得 到 了 同样 的 结论 。 
此 外 人 工 神 经 网 络 作为 深度 学 习 的 基本 组 成 部 分 ， 
也 被 证 明 具有 较 高 的 分 类 准确 度 。Grossi 等 (2017) 
基于 ANN 搭 建 了 一 种 新 型 分 类 系统 ,将 多 比例 尺 
分 级 组 织 图 与 时 间 压 缩 的 隐 函 数 (Multi-Scale 
Ranked Organizing Map, MS- ROM/Implicit 
Function as Squashing Time, I-FAST) 算 法 相 结 合 ， 
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以 脑 电 图 像 为 判别 指标 ， 发 现 该 算法 对 ASD 预测 
准确 率 高 达 100%。 但 也 有 研究 显示 , 传统 算法 可 
以 通过 增加 分 类 器 数量 进行 自我 优化 。 随 机 森林 
将 bootstrap 再 抽样 和 决策 树 算法 相 结合 ， 构 建树 
型 分 类 器 集合 ( 曹 正 凤 ,2014)， 分 类 速度 、 准 确 性 
和 抗 噪 性 能 明显 高 于 单一 分 类 器 算法 , 还 可 以 在 
一 定 程度 上 减轻 过 拟 合 问题 。Wingfield 等 (2020) 
开发 的 ASD MAET, 发现 RF 相 较 单一 的 NB、 
DT 分 类 效果 明显 优化 ,AUC 达到 98%, 

机 器 学 习 算 法 无 需 明 确 编码 ， 可 以 自动 检测 
数据 中 存在 的 模式 ， 处理 复杂 的 非 线 性 数据 ， 相 
比 传统 识别 和 诊断 方法 具有 强大 的 功能 优势 。 近 
年 来 在 ASD 分 类 研究 中 的 应 用 还 呈现 出 从 传统 
算法 向 深度 学 习 过 渡 的 趋势 ,诊断 效率 大 幅 提 
升 。 但 目前 超过 75% 的 研究 使 用 的 仍 是 传统 机 器 
学 习 算 法 ， 对 于 深度 学 习 的 关注 有 待 提高 。 此 外 
当前 研究 中 算法 众多 , 不 同 研究 者 使 用 的 算法 存 
在 很 大 差异 , 同一 算法 对 不 同 对 象 施 测 结果 也 有 
不 同 ,对 于 最 佳 算法 的 争议 一 直 没 有 停止 。 因 此 
未 来 研究 应 继续 深入 探讨 如 何 找 出 最 佳 算法 ,更 
大 程度 发 挥 技 术 的 价值 。 

42 ”机 器 学 习 效 果 评 价 

效果 评价 是 模型 构建 的 指挥 棒 和 导航 塔 。 数 
据 收 集 和 算法 选择 后 ， 需 要 对 模型 有 效 性 加 以 验 
证 。 机 器 学 习 效 果 评 价 一 般 是 以 专业 医师 诊断 为 
校 标 ， 计 算 相 关系 数 或 成 功 预测 比例 得 到 的 。 根 
据 原始 二 分 类 数据 特征 ， 一般 将 分 类 效果 分 为 正 
类 (Positive) 和 负 类 (Negative)， 其 中 真 阳性 和 真 阴 
性 是 预测 良好 中 的 正 类 和 负 类 ,， 假 阴性 和 假 阳 性 
是 预测 不 良 中 的 正 类 和 负 类 ( 见 表 3)。 具体 的 模型 
性 能 评价 指标 包括 : (1) {EW (Accuracy, Acc-), 
是 指 分 类 正确 的 样本 数 占 总 样本 数 的 比例 。 通 常 
来 说 ,准确 率 越 高 ,分 类 效果 越 好 。 计 算 公 式 为 
Acc- = (TP + TN) / (TP + FN + FP + TN); (2) 敏 感 
Æ (Sensitivity, Sen-)， 指 正 类 中 自 财 症 儿 童 分 类 正 
确 的 比例 ， 又 称 召 回 率 (recall)、 真 阳性 率 (True 
Positive Rate, TPR)。 计 算 公 式 为 Sen- = TP / (TP + 
FN); (3) 特 异 度 (Specificity，Spe-)， 指 负 类 中 自 闭 
症 儿 童 分 类 正确 的 比例 ， 又 称 真 阴性 率 (True 
Negative Rate, TNR)。 计 算 公 式 为 Spe- = TN / (FP 
+ TN); (4) 接 收 者 操作 特性 曲线 (operating 
characteristic curve, ROC 曲线 )， 是 一 种 以 假 阳 性 
率 为 X 轴 ， 以 真 阳性 率 为 Y 轴 组 成 的 图 形 ， 主 要 


通过 计算 ROC 曲线 下 面 的 面积 (Area Under ROC 
Curve, AUC/AUROC) 对 分 类 性 能 进行 比较 。 一 般 
来 说 ,AUC/AUROC RK, 分 类 效果 越 好 。 除 上 述 
4 种 常用 指标 外 ， 部 分 研究 还 采用 了 阳性 预测 值 
(Positive Predictive value, PPV). 、 阴 性 预测 值 
(Negative Predictive value，NPV) 、 错 误 率 (false 
discovery rate /error rate, FDR) 等 指标 来 考察 分 类 
器 效果 。 


表 3 ASD 二 分 类 数据 的 混淆 矩阵 


预测 
ASD Non-ASD 
ASD 真 阳 性 假 阴 性 
(True Positive, TP) (False Negative, FN) 
真实 
Non-ASD 假 阳 性 真 阴 性 


(False Positive, FP) (True Negative, TN) 


43 ”机 器 学 习 流 程 

逻辑 清晰 、 完 备 有 序 的 数据 处 理 流 程 是 模型 
有 效 落 实 的 显 性 表现 。 机 器 学 习 应 用 于 ASD 早期 
识别 和 诊断 大 致 经 过 以 下 4 个 步骤 : 首先 是 收集 
数据 阶段 ， 也 就 是 选择 ASD 分 类 所 需 影 像 . 量 表 、 
行为 等 数据 指标 。 其 次 是 原始 数据 处 理 阶 段 。 该 
阶段 主要 目的 是 实现 特征 选择 , 通过 过 采样 、 欠 
采样 等 方法 对 重复 记录 、 缺 失 值 和 不 平衡 数据 进 
行 降 噪 ， 降 低 计 算 复 杂 性 和 提高 分 类 精度 ， 形 成 
分 类 所 需 数据 集 (Rahman et al., 2020)。 然 后 就 进 
入 自 闭 症 和 对 照 组 分 类 阶段 。 该 阶段 通常 会 采用 
k 折 交 叉 验 证 将 整个 数据 集 随 机 分 为 k 份 , 其 中 1 
份 作为 测试 集 (testing set), k-1 份 用 于 训练 ， 其 中 
训练 的 数据 又 可 以 随机 分 为 训练 集 (training set) 
和 验证 集 (validation set)， 这 样 交 又 验 证 k 次 , 每 
一 份 都 可 以 作为 测试 集 进 行 测试 , 平均 k 次 的 结 
R, 得 到 最 终结 果 。 具 体 流程 又 可 简 述 为 : 第 一 ， 
输入 训练 集 ,， 采用 机 器 学 习 算 法 进行 训练 ,构建 
ASD 分 类 模型 ; 第 二 , 将 验证 集 输入 模型 中 ， 比 
较 模 型 预测 结果 和 “ 自 闭 症 ” 标 记 数 据 的 区 别 ， 验 
证 模型 分 类 准确 性 ; 第 三 , 测试 集 测评 模型 分 类 
性 能 。 最 后 获取 最 佳 分 类 模型 。Epalle 等 (2021) 
构建 的 DNN 模型 就 是 遵从 了 这 一 程序 , 借助 
ABIDE-I 中 的 脑 成 像 数 据 区 分 ASD 和 TD。 数据 
处 理 阶 段 利 用 过 采样 进行 特征 选择 , 使 CC200 集 


增加 19900 MARIE, AAL90 集 增加 4005 个 特征 ， 
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DOS160 集 增 加 12720 个 特征 ; 在 分 类 阶段 , 采用 新 生 儿 患 自 闭 症 的 风险 , 采用 最 小 绝对 收缩 和 选 


10 折 交 叉 验 证 (10-fold cross- validation), 5 折 分 层 
交叉 验证 ($-folds stratified cross-validation) Fil fa — 
法 (Leave-one-site-oub) 构 建 分 类 器 和 评估 分 类 结 
R, 在 每 一 部 分 数据 中 , 设置 70% 用 于 训练 , 20% 
用 于 验证 , 10% 用 于 测试 。 最 后 模型 验证 结果 显示 
该 分 类 器 对 两 组 被 试 的 分 类 准确 率 可 达 78.07%。 
机 融 学 习 应 用 于 ASD 儿童 分 类 自动 分 配 训 
练 集 和 测试 集 ， 经 过 过 滤 和 反复 检测 选择 和 提取 
数据 特征 ,发现 数据 隐藏 规律 ， 从 来 源 上 减少 了 
数据 偏差 .增加 了 研究 的 内 部 效 度 。 模 型 有 效 性 
的 验证 范围 涵盖 Acc-. Sen-. Spe-. AUC, PPV 
Al NPV 等 多 个 维度 ， 越 来 越 注 重 对 于 模型 的 客观 
测量 ,也 在 一 定 程 度 上 增加 了 研究 的 外 部 验证 。 
但 是 通过 文献 汇总 也 能 够 看 出 ， 目 前 研究 中 采用 
的 分 类 指标 组 合 大 相 径 庭 ， 指 标 报告 的 数量 参差 
不 齐 , 缺乏 较为 一 致 、 普 遍 被 大 家 认可 的 分 类 效 
果 指 标 体系 。 另 外 ，Falkmer 等 (2013) 认 为 自 闭 症 
分 类 模型 的 准确 率 应 至 少 达到 或 高 于 80% 才 可 以 
被 视 为 达到 了 要 求 , 但 当前 部 分 研究 的 准确 率 其 
至 不 足 60%, 距离 分 类 准确 率 的 要 求 还 相差 不 少 
(Bussu et al., 2018)。 后 续 人 研究 如 何 从 技术 层面 上 
继续 优化 和 规范 这 些 问题 , 还 需要 更 深入 的 探讨 。 


5 基于 机 器 学 习 的 自 闭 症 早期 识别 和 
诊断 研究 应 用 


51 预测 自 闭 症 患 病 风险 因素 
自 闭 症 作为 一 种 病因 不 明 的 神经 发 育 障 碍 ， 
仅仅 依靠 常规 的 产 前 检查 无 法 达到 预防 目的 。 机 
器 学 习 技 术 可 以 通过 广泛 收集 影像 和 生物 指标 信 
息 ， 充 分 挖掘 和 汇总 信息 ， 计 算得 出 具备 预测 功 
能 的 数据 模型 ， 实 现 对 自 闭 症 患 病 风 险 的 有 效 预 
WARR 等 , 2022), 为 自 闭 症 病因 探索 与 综合 
诊疗 提供 新 的 方向 。 

孕 产 期 环境 和 母体 自身 健康 因素 都 有 可 能 影 
响 胚 胎 发 育 质 量 ， 产 前 对 于 孕妇 (尤其 是 高 风险 孕 
妇 ) 和 胎儿 的 医学 检查 与 监护 可 能 有 助 于 发 现 自 
闭 症 风险 因素 。 机 器 学 习 可 以 通过 对 超声 波 检查 、 
羊膜 腔 穿 刺 、X 射线 检查 、 绒 毛细 胞 检查 、 胎 儿 
镜 检 查 等 收集 的 影像 信息 和 生物 标记 物 信息 ， 推 
Mj ASD 患 病 影响 因素 。 如 Caly 等 (2021) 通 过 收集 
和 台 儿 的 超声 波 测量 值 (包括 股骨 长 度 、 头 于 、 腹 围 
等 ) 和 生物 学 特征 (如 IgG 巨细 胞 病毒 水 平等 ) 预 测 


择 算法 (Least Absolute Shrinkage and Selection 
Operator, LASSO), DT 和 极端 梯度 提升 (eXtreme 
Gradient Boosting, XGBoost) 算 法 构建 分 类 模型 ， 
研究 结果 显示 模型 阳性 预测 值 可 达 77%。 和 母体 免 
疫 性 疾病 家 族 史 、 和 母体 对 巨细 胞 病毒 的 免疫 力 、 
孚 晚期 胎儿 股骨 长 度 、 孕 晚期 胎儿 白细胞 数量 、 
新 生 儿 心率 和 人 性别 等 10 项 指标 可 以 作为 ASD Til 
测 标记 物 。 基 因 是 决定 生命 健康 的 内 在 因素 。 基 
因 检测 可 以 提取 细胞 中 的 DNA 分 子 信息 ， 确 定 新 
生 儿 基因 类 型 和 缺陷 。 机 器 学 习 技术 通过 梳理 复 
杂 的 遗传 信息 ， 可 以 帮助 发 现 与 自 闭 证 患 病 有 关 
的 遗传 因素 。Bahado-Singh 等 (2019) 利 用 450k Hi 
基 化 芯片 (Infinium HumanMethylation450 BeadChip) 
检测 ASD 和 TD 新 生 儿 血 斑 中 的 白细胞 DNA, 发 
现在 胞 喀 啶 基因 中 CpG 位 点 甲 基 化 异常 显著 ， 预 
测 结果 AUC 为 100%。 同 时 人 研究 者 还 发 现 自 闭 症 
在 EIF4E 、FYN 、SHANK1 、VIM 、LMXI1B 、 
GABRB1、SDHAP3 和 PACS2 基因 中 存在 表 观 遗 
传 调控 障碍 。Oh 等 (2017) 以 及 Sekaran 和 Sudha 
(2020) 研 究 也 证 明 外 周 血 基因 表达 谱 (gene 
expression profiles) 和 FAM104B 、CCNDBP1 、 
HIF0、ZER1 等 生物 标记 能 够 实现 对 ASD 个 体 的 
分 类 和 预测 ,其 准确 率 分别 可 达 93.8% 和 
97.62%。 还 有 学 者 报告 长 链 非 编码 RNA (long 
non-coding RNA, IncRNA) 也 能 够 用 于 预测 新 生 儿 
HE ASD 风险 (AUC = 83.9%; Gök, 2018)。Qiu 等 
(2020) 基 于 SVM 构建 的 预测 模型 显示 , 一 碳 单位 代 
谢 (folate-dependent one carbon metabolism, FOCM)、 
转 硫 作用 (transsulfuration，TS) 中 的 多 种 代谢 物 以 
及 母体 孕前 和 孕期 摄 和 人 的 叶酸 含量 也 可 以 作为 新 生 
儿 自 闭 症 风险 预测 的 指标 , 该 模型 预测 的 准确 率 
达到 96% 以 上 。 借 助 机 器 学 习 对 HR-ASD 家 族 婴 儿 
的 大 脑 功能 连接 磁 共 振 成 像 (functional connectivity 
Magnetic Resonance Imaging，fcMRD 进 行 追踪 研 
究 , 将 ASD 风险 预测 年 龄 提前 到 了 胎儿 出 生 后 6 
个 月 (Emerson et al., 2017)。 

52 fim fe BE 

星期 自 闭 证 筛 查 可 以 在 大 范围 人 群 中 发 现 高 
危 儿 童 ， 对 于 改善 自 财 症 儿 童 社会 适应 、 预 防 继 
发 性 发 育 障 碍 和 减轻 家 庭 与 社会 负担 具有 重要 意 
义 ( 陈 光华 等 , 2022)。 如 果 第 查 工作 可 以 直接 由 
家 长 或 其 他 熟悉 儿童 的 人 员 操 作 ， 就 可 以 更 早 发 
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现 潜在 ASD 患者 ,避免 错失 干预 时 机 。Thabtah 等 
(2018) 借 助 机 器 学 习 模型 简化 传统 量 表 (CHAT AQ), 
开发 了 一 款 适合 ASD 筛 查 的 移动 应 用 程序 一 一 
ASD Tests, 该 工具 可 以 在 手机 端 免费 下 载 使 用 ， 
适用 范围 涵盖 婴 幼 儿 期 (1~3 岁 )、 儿 童 期 (4~11 岁 )、 
青少年 期 (12~16 岁 ) 和 成 人 期 (17 岁 之 后 ) 四 个 阶段 ， 
每 个 阶段 仅 有 10 道 测试 题 ， 测 试 时 间 在 3~5 分 钟 
以 内 ， 非 专业 人 员 也 能 轻松 操作 。 研 究 发 现 该 程 
序 对 于 儿童 、 青 少年 和 成 人 阶段 HR-ASD fy iff AE 
灵敏 度 、 特 异性 和 准确 率 均 高 于 95%, 分 类 性 能 
良好 (Thabtah et al., 2019)。Raj 和 Masood (2020) 
基于 个 体 性 别 、 种 族 、 是 否 先 天 黄 盖 等 21 项 特征 
构建 自 闭 症 第 查 模型 ,发现 CNN 在 儿童 、 青 少年 
和 成 人 群体 中 得 查 的 准确 率 分别 可 以 达到 98.30%、 
96.88% 和 99.53%， 能 够 快速 地 在 大 范围 人 群 中 找 
出 自 闭 症 患 者 。 除 此 之 外 ,神经 影像 数据 和 行为 
表现 作为 风险 识别 重要 的 内 外 部 参照 ,也 被 广泛 
应 用 于 筛 查 或 诊断 模型 的 构建 ， 取 得 了 令 人 满意 
的 效果 (Dickinson et al., 2020; Lai et al., 2020; Qiu 
et al., 2020; Rakić et al., 2020)。 
53 ”辅助 诊断 自 闭 症 

诊断 是 对 筛 查 出 的 高 危 儿 童 做 更 全 面 细致 的 
专业 检测 。 传 统 诊断 方法 通过 观察 儿童 外 在 行为 
和 家 长 报告 方式 获取 数据 ， 易 受 评估 人 员 主 观 性 
和 报告 者 回忆 偏差 影响 。 诊 断 过 程 中 存在 的 等 待 
周期 长 、 误 诊 等 问题 也 阻碍 了 后 续 临 床 干 预 的 实 
施 。 机 器 学 习 辅 助 专业 人 员 诊 断 可 以 纳入 大 量 客 


等 (2020) 对 3~12 岁 的 ASD 和 TD 脑 电 图 进行 分 析 ， 
基于 SVM 和 KNN 建立 诊断 模型 准确 率 达 到 
94.089%6 。 
54 ”管理 评估 和 干预 过 程 

自 闭 症 早期 预测 、 识 别 和 诊断 的 最 终 目的 是 
为 了 给 儿童 提供 行 之 有 效 的 早期 干预 。 收 集 自 闭 
症 群体 评估 和 干预 过 程 信息 ,追踪 干预 施行 效果 ， 
可 以 为 确定 儿童 生理 病理 机 制 和 治疗 靶 点 提供 思 
路 。 然 而 传统 的 得 查 、 诊 断 、 干 预 和 预后 再 评 是 
几 个 相对 独立 和 分 散 的 环节 ， 难 以 对 信息 进行 比 
较 系统 的 收集 和 整合 ， 也 就 更 难 发 现 和 把 握 数 据 
的 内 在 趋势 和 隐藏 特征 ， 造 成 了 数据 的 浪费 。 基 
于 机 器 学 习 的 分 类 一 大 优势 还 在 于 对 数据 的 有 效 
利用 ,在原 有 评估 和 干预 数据 基础 上 构建 一 体 化 智 
能 评估 和 干预 管理 系统 ,增强 对 自 闭 症 儿 童 诊断 和 
干预 的 跟踪 式 监控 (Koumpouros & Kafazis, 2019)。 
Cognoa (Cognoa ASD Screener/ Cognoa ASD 
Diagnosis Aid) 是 一 款 以 机 器 学 习 技 术 为 支撑 的 新 
型 ASD 评估 程序 ,， 兼 具 盘查 、 诊 断 和 风险 预测 功 
能 。 该 程序 主要 服务 对 象 为 婴 幼 儿 至 学 龄 前 期 自 
闭 症 儿童 (18 个 月 ~5 岁 ), 需要 家 长 完成 一 份 包含 
15 道 题目 的 问卷 ,并 上 传 两 个 以 上 时 长 1~2 分 钟 
的 儿童 日 常生 活 视频 (如 用 餐 、 游 戏 时 间 ), 资料 上 
传 完成 后 ,后 台 自 动 评分 输出 风险 值 ， 整个 过 程 
约 为 15 分 钟 (Kanne et al., 2018), 每 次 测评 结束 程 
序 会 自动 保存 结果 。2021 年 6 A, 美国 食品 和 药 
物 监管 局 (Food and Drug Administration, FNA) 对 该 


s 


观 分 类 指标 ,在 一 定 程 度 上 减少 主观 施 测 弊端 ， 
还 能 够 减少 耗 时 ， 降 低 等 待 成 本 。 社 交 机 器 人 是 
ASD 智能 诊断 中 的 常用 工具 ， 其 设计 有 趣 亲 切 ， 
通过 丰富 的 面部 和 肢体 语言 与 受 测 者 沟通 ， 可 以 
ae A AEREA E, 2018), Ramirez- 
Duque 等 (2019) 采 用 RGBD 传感器 采集 HR-ASD 
和 TD 幼儿 与 ONO 社交 机 器 人 互动 的 行为 特征 ， 
利用 CNN 构建 两 类 儿童 面孔 识别 模型 ， 辅 助 专 
业 人 员 对 ASD 儿童 进行 诊断 ， 发现 该 模型 可 以 实现 
ASD 的 自动 化 识别 , 花费 时 间 不 超过 40 分 钟 ， 准 确 
性 与 临床 专家 诊断 结果 基本 一 致 。Diehl 等 (2012) 
也 发 现 社交 机 器 人 可 以 作为 自 闭 症 诊断 和 干预 的 
有 效 工 具 。 影 像 和 传统 量 表 也 为 机 器 学 习 辅 助 诊 
断 提供 了 有 效 证 据 (Bone et al., 2016), Tariq 等 
(2018) 以 ADOS 和 ADI-R 为 指标 构建 的 模型 诊断 
准确 率 高 于 94%, 灵敏 度 也 超过 90%. Abdolzadegan 


程序 应 用 于 自 闭 症 患 者 诊断 的 可 行 性 进行 核定 ， 
发 现 来 自 14 家 医疗 中 心 的 425 名 儿童 程序 诊断 结 
果 与 专家 结论 基本 完全 一 致 ， 获 批准 上 市 使 用 。 

基于 机 器 学 习 技 术 建立 的 自 闭 症 图 片 评 估 智 能 管 
理 系统 ， 还 可 以 记录 ASD 从 早期 筛 查 到 干预 治疗 
过 程 中 儿童 能 力 变化 数据 ， 获 得 儿童 预后 再 评 信 
息 (Perera et al., 2017)。 人 工 神 经 网 络 支持 的 专家 
系统 ， 甚 至 可 以 在 无 预先 编程 设 定 的 情况 下 机 智 
应 对 和 解决 不 确定 性 问题 ,为 自 闭 症 诊断 和 干预 
提供 实时 建议 ,， 是 临床 评估 中 的 “得 力 助手 ”( 靳 
宇 倡 等 , 2022; Negin et al., 2021; Rahman et al., 
2020)。 

综 上 所 述 , 机 融 学 习 在 自 闭 症 分 类 中 的 应 用 
涵盖 病因 分 析 ， 患 病 风 险 预 测 ， 潜 在 危机 人 群 第 
A, 辅助 诊断 和 智能 病程 管理 。 这 些 工作 的 开展 
有 助 于 增加 从 业 人 员 对 自 闭 症 病因 病程 信息 的 掌 
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握 ， 实 现 盘查 、 诊 断 、 干 预 和 预后 再 评 的 动态 化 
管理 ,节约 长 期 随访 所 需 的 人 力 物 力 资源 , 更 快 
找 出 众多 个 性 因素 中 的 “共性 ” 提高 诊疗 的 有 效 性 ， 
这 也 是 我 们 未 来 临床 诊疗 可 以 借鉴 的 一 个 思路 。 


6 机 器 学 习 应 用 于 自 闭 症 儿 童 识别 和 
诊断 的 优势 与 不 足 


6.1 优势 

目前 机 器 学 习 技 术 已 经 应 用 于 自 闭 症 儿 童 早 
期 预测 、 筛 查 和 诊断 ， 其 客观 性 、 便 捷 性 和 有 效 
性 经 过 了 较为 广泛 的 验证 , 分 类 性 能 在 不 断 的 优 
化 和 完善 中 也 表现 越 来 越 好 ， 部 分 智能 工具 也 开 
始 推广 应 用 。 相 较 于 经 验 诊断 和 传统 测量 ， 机 器 
学 习 的 融入 体现 了 人 工 智能 技术 的 一 些 优势 ， 集 
中 表现 在 4 个 方面 。 第 一 ， 机 器 学 习 获 取 和 整理 
数据 指标 的 能 力 更 强 ， 有 助 于 构建 多 模 态 分 类 模 


孩子 及 其 家 庭 获 得 更 高 的 生活 质量 , 减少 因 障 碍 
引发 的 各 种 社会 适应 问题 。 
6.2 不 足 与 展望 

虽然 机 器 学 习 在 ASD 儿童 识别 和 诊断 中 具 
有 一 定 的 方法 学 优势 ， 相 关 研 究 成 果 也 逐步 增多 ， 
但 距离 大 范围 应 用 还 有 一 定 距离 ， 其 面临 的 具体 
问题 与 可 能 的 解决 方法 可 总 结 为 以 下 三 个 方面 。 
首先 ， 缺 少 孕 产妇 和 新 生 儿 自 闭 症 病源 追踪 
人 研究。 遗传 学 研究 结果 表明 ,常见 的 遗传 变化 ， 如 
基因 突变 、 易 位 、 倒 位 和 拷贝 数 变异 等 都 可 能 与 
ASD 的 产生 存在 一 定 程 度 的 相关 ， 患 有 ASD 的 新 
生 儿 拷贝 数 变 异 频率 明显 高 于 TD (Sanders et al., 
2011)。 也 有 研究 报告 ASD 可 能 是 由 影响 细胞 增 
殖 、 迁 移 和 许多 其 他 基本 过 程 的 致 病 事件 序列 导 
致 (Caly et al., 2021)。 对 自 闭 症 儿 童 大 脑 的 尸检 报 
告 也 显示 其 前 额 叶 皮 层 神经 元 异常 过 剩 ， 还 存在 


型 。 传 统 分 类 方法 主要 是 通过 对 外 显 行为 指标 的 
观测 得 出 结论 ,参考 的 变量 有 限 ， 机 器 学 习 可 以 
集合 多 种 类 型 、 不 同 观 测 方法 获得 的 数据 指标 ， 
兼顾 内 在 和 外 部 影响 因素 , 减少 主观 误差 ， 提 高 
预测 和 识别 结果 的 全 面 性 和 客观 性 。 此 外 ， 机 器 
学 习 模型 还 能 够 跟踪 评估 和 诊断 过 程 管理 ， 增 加 
了 数据 的 利用 率 。 第 二 ， 机 器 学 习 降 低 了 预测 和 
识别 的 时 间 成 本 ,提高 了 测评 效率 , 减轻 诊断 人 
员 压 力 。 分 类 模型 的 建立 一 方面 可 以 通过 大 范围 
筛 查 ， 快 速 发 现 高 风险 自 闭 症 患者 ， 尽 早 引 起 家 
长 和 其 他 相关 人 员 的 警觉 ; 另 一 方面 还 可 以 通过 
减少 测试 项 目 、 缩 短评 测 流程 等 有 效 压 缩 诊断 时 
间 ， 降低 施 测 的 等 待 时 间 , 减少 专业 医师 压力 。 第 
=, 机 器 学 习 增 加 了 研究 的 内 外 部 效 度 。 机 器 学 
习 的 建 模 过 程 和 计算 原理 区 别 于 传统 方法 ， 可 以 
自动 将 原始 数据 分 为 训练 集 和 验证 集 ， 无 需 数据 
生成 模型 和 参数 估计 直接 输入 性 能 指标 , 模型 还 
可 以 随 样 本 数量 累积 不 断 优化 ,提升 了 研究 的 内 
部 效 度 和 外 部 推广 力 , 也 有 利于 加 速 模型 应 用 于 
实践 的 速度 。 第 四 ， 机 器 学 习 可 自动 提取 关键 特 
征 ， 帮助 建立 风险 预警 机 制 。 机 器 学 习 可 以 捕捉 
肉眼 无 法 观测 到 的 细微 表情 或 身 势 动作 变化 , 减 
少 关键 指标 的 遗漏 ， 还 适用 于 非 线 性 数据 ， 可 以 
从 纷繁 复杂 的 数据 中 心 抽 丝 剥 昔 ， 更 适合 分 析 
ASD 这 一 类 成 因 不 明 、 结 构 复杂 的 疾病 ,降低 症 
状 恶 化 的 可 能 。 尤 其 是 对 于 婴 幼儿 和 学 龄 前 期 儿 
童 , 早 发 现 、 早 干预 能 够 发 挥 最 大 效益 ,帮助 这 些 


脑 过 度 生 长 和 巨 脑 问题 (Tyzio et al.，2014)。 
Rahman 等 (2020) 还 发 现 父 母 的 年 龄 、 家 庭 病 史 也 
会 增加 新 生 儿 上 患 自 闭 症 的 风险 。 这 些 证 据 表 明 自 
闭 症 受 遗 传 因素 的 影响 ， 且 这 些 病 症 在 个 体 胚胎 
形成 和 发 展 时 期 可 能 就 已 经 出 现 (Caly et al., 2021)。 
除 遗 传 因素 外 ， 孕 产妇 暴露 于 危险 环境 也 是 自 闭 
症 患 病 的 易 感 因素 之 一 。Choi 等 (2016) 研 究 发 现 ， 
ASD 发 病 率 增加 与 母体 病毒 或 微生物 感染 、 发 热 
以 及 免疫 系统 疾病 有 关 。 在 孕期 服用 药物 ， 特 别 
是 丙 戊 酸 钠 (sodium valproate)， 和 维生素 缺乏 可 
能 导致 胎儿 趴 患 自 亲 症 。 痢 腹 产 、 早 产 和 新 生 儿 
并 发 症 等 问题 也 会 增加 ASD 的 发 病 比 例 (Cloarec 
et al., 2019)。 这 提示 我 们 个 体 生命 早期 的 内 外 部 
环境 是 导致 自 闭 症 出 现 的 关键 因素 。 

理 清 自 闭 症 个 体 发 展 初 期 病理 、 病 因 和 病程 
因素 可 能 会 为 患 病 风险 预测 和 防 控 提 供 新 的 契机 ， 
但 遗憾 的 是 当前 文献 研究 中 还 很 少 有 借助 孕 产 期 
数据 进行 自 闭 症 识别 的 研究 。 当 前 文献 中 仅 有 的 
两 篇 ，Caly 等 (2021) 采 集 了 孕 产 妇 从 孕 早 期 到 胎 
儿 出 生 后 1 天 内 常规 生物 标记 物 和 超声 测量 值 来 
预测 自 闭 症 ， 并 与 儿童 4~5 岁 时 诊断 结果 进行 比 
Be 预测 准确 率 达 到 了 77%。Bahado-Singh 等 (2019) 
采集 249 种 新 生 儿 (出 生 24~79 小 时 ) 白 细胞 表 观 
基因 组 标志 物 ， 成 功 预测 了 后 期 被 诊断 为 自 闭 症 
的 儿童 (Sen- = 97.5%, Spe- = 100% )。 这 启示 我 们 
如 果 能 在 胚胎 形成 和 新 生 儿 发 展 初期 ， 广泛 收集 
孕 产 妇 及 其 家 庭 成 员 健 康信 息 ， 关 注 遗 传 和 环境 
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中 可 能 的 致 畸 因素 ,尤其 是 较为 稳定 的 生物 标记 
物 ， 借 助 机 器 学 习 模 型 庞大 的 数据 梳理 功能 提取 
其 中 的 共性 因子 , 是否 就 有 可 能 逐步 摆脱 “被 动 
等 候 ” 的 局 面 ， 变 为 “主动 防御 ”。 因 此 未 来 研究 可 
在 遵循 伦理 原则 的 基础 上 ， 尝 试 借助 孕期 筛 查 和 
新 生 儿 体检 等 环节 建立 儿童 生理 病理 信息 数据 库 ， 
收集 儿童 (尤其 是 高 危 家 族 儿 童 ) 从 胚胎 期 到 出 生 
期 间 的 过 程 性 信息 ， 也 可 借鉴 美国 儿科 学 会 的 做 
法 ,在 确保 参与 者 知情 同意 的 前 提 下 于 固定 时 间 
段 ( 如 出 生 时 、 出 生 后 8 个 月 、18 个 月 等 ) 进 行 长 
期 追踪 研究 (Wan et al., 2019), 获取 自 闭 症 个 体 发 
展 初 期 病源 的 原始 性 资料 ， 归 纳 可 能 的 风险 因素 ， 
及 早 规避 和 预防 这 一 障碍 的 出 现 。 
其 次 ， 缺 少 标准 化 模型 分 类 数据 体系 。 机 器 
学 习 模型 为 海量 信息 处 理 提供 了 可 能 性 ， 但 技术 
本 身 对 于 数据 的 包容 也 可 能 成 为 一 把 双 为 剑 。 现 
有 机 器 学 习 分 类 指标 虽然 形式 多 样 , (HAA ER, 
缺少 清晰 明确 的 分 类 依据 和 系统 化 、 规 则 化 的 应 
用 效果 分 析 , 测评 结果 的 可 验证 程度 不 高 。 以 基 
于 行为 的 单一 模 态 分 类 指标 为 例 ， 研 究 者 所 使 用 
的 具体 指标 包含 了 重复 刻板 行为 、 反 抗 行为 、 自 
我 伤害 行为 、 精 细 / 粗 大 动作 、 社 会 交往 行为 、 社 
会 性 微笑 、 共 同 注意 、 模 仿 、 眼 神 变化 、 表 达 性 
和 接受 性 语言 等 数 十 种 行为 表现 。 不 同行 为 表现 
又 可 以 细 化 为 更 微观 的 分 类 指标 ， 仅 眼神 变化 一 
项 就 可 以 分 化 出 眼神 检索 (eye scanning). AR AE Ba 
(eye tracking) 和 眼神 接触 (eye touching/contacting) 
等 多 种 范式 。 但 是 即使 是 同一 行为 表现 , 得 出 的 
结论 也 不 完全 一 致 (Shic et al., 2014; Wan et al., 
2019)。 基 于 量 表 的 分 类 也 出 现 了 这 一 问题 , 研究 
文献 中 包含 多 种 分 类 工具 , PATRAS WEE 
和 施 测 对 象 也 不 一 致 。 即 使 是 同一 测验 工具 ,项 
目的 筛选 标准 与 结论 也 不 完全 统一 (Emerson et al., 


标 体 系 。 有 研究 者 提出 ,年 龄 可 以 作为 分 类 指标 
划分 的 一 个 依据 。Liu 等 (2016) 的 研究 显示 婴 幼 儿 
和 儿童 期 ASD 识别 更 适用 于 眼神 交流 、 手 势 和 面 
部 表情 等 非 语 言行 为 特征 ， 青少年 ASD 则 更 应 侧 
重 于 和 同伴 的 语言 交流 与 情感 互动 。 随 着 年 龄 增 
长 , 社会 性 沟通 与 情感 联结 成 为 更 重要 的 分 类 指 
标 。 此 外 , 大脑 的 变化 经 常 出 现在 临床 表现 之 前 
且 具 有 和 较 高 的 稳定 性 (Elsabbagh et al., 2012; Wolff 
et al., 2012; Wolff et al., 2015)， 因 此 分 类 过 程 中 应 
特别 重视 客观 影像 指标 的 应 用 (Emerson et al., 
2017; Hazlett et al., 2017; Itani & Thanou, 2021)。 
言语 智商 、 自 闭 症 严重 程度 等 经 过 验证 的 也 较为 
容易 收集 的 分 类 标准 也 可 以 直接 纳入 分 类 体系 
(Katuwal et al., 2016)。 但 是 这 类 判别 标准 仍 相 对 
宽泛 , 无 法 完全 满足 自 闭 症 特 异性 对 指标 选取 的 
精细 化 要 求 。 未 来 研究 可 在 已 有 研究 成 果 的 基础 
E, 一 方面 继续 细 化 行为 、 量 表 、 影 像 等 指标 适 
用 范围 ,按照 分 类 性 能 (准确 性 、 稳 定性 等 ) 对 具体 
指标 进行 规则 排序 ; 另 一 方面 应 探究 不 同 模 态 间 
如 何 有 机 结合 、 优 势 互 补 , 兼顾 自 闭 症 患 儿 的 内 
部 神经 机 制 和 外 在 行为 表现 ， 更 好 地 激发 多 模 态 
数据 隐藏 的 价值 。 

最 后 ， 理 论 模 型 向 现实 应 用 的 转化 还 未 完全 
成 熟 。 机 器 学 习 可 以 帮助 家 长 或 其 他 从 业 人 员 提 
前 知晓 疾病 风险 ， 及 早 制 定康 复方 案 。 但 是 现 有 
研究 仍 停留 在 模型 构建 的 理论 阶段 ， 模 型 应 用 到 
实践 中 还 需要 慎重 思考 以 下 几 个 问题 。 一 是 研究 
样本 对 总 体 的 代表 性 。 已 有 研究 模型 中 选用 的 被 
试 通常 是 经 过 选择 的 ， 多数 为 高 风险 自 闭 症 家 族 
人 群 ， 自 闭 症 所 占 比重 远 超 典 型 发 展 人 群 正常 值 
(20%~33%; 1%), 评估 结果 知 直 接应 用 到 普通 人 
群 中 是 否 能 够 兼容 (Rahman et al., 2020; Thabtah, 
2019); 二 是 模型 的 适用 性 和 可 推广 性 。 受 限于 研 


2017)。 基 于 多 模 态 的 分 类 模型 ,在 融合 多 元 信息 
过 程 中 混杂 了 更 多 与 测评 关联 程度 不 高 的 信息 ， 
对 测试 准确 性 有 一 定 干扰 。 多 种 模 态 的 组 合 ， 同 
一 模 态 不 同 分 类 指标 的 组 合 ,为 研究 者 提供 了 更 
多 分 类 标准 选择 的 同时 ， 也 带 来 了 更 多 的 测量 误 
差 , 不 利于 研究 结果 的 推广 和 泛 化 。 

因此 模型 构建 过 程 中 应 重视 分 类 指标 内 部 秩 
序 性 , 梳理 出 分 类 指标 选取 的 标准 与 依据 ， 逐步 
确定 出 一 部 分 稳定 性 强 、 适 应 范围 广 、 准 确 度 高 
的 分 类 指标 , 构建 更 具 科学 性 和 稳定 性 的 分 类 指 


究 可行 性 因素 , 目前 超过 1/3 的 研究 样本 量 不 足 
300 人 ， 可 能 存在 采样 偏差 ， 且 很 少 有 研究 报告 
成 果 在 不 同文 化 背景 、 地 理 区 域 被 试 群体 中 的 验 
证 ,理论 模型 的 泛 化 能 力 还 不 能 确定 (Liaqat et al., 
2021; Mazumdar et al., 2021)。 三 是 算法 的 准确 度 
和 稳定 性 有 待 改善 。 当 前 模型 仍 多 采用 为 传统 机 
器 学 习 算 法 ， 部 分 模型 分 类 准确 率 尚 不 足 60%, 
稳定 性 也 难以 满足 大 范围 施 测 要 求 。 四 是 模型 功 
能 较为 单一 。 当 前 研究 成 果 只 能 对 个 体 是 否 为 自 
闭 症 做 简单 的 二 分 类 判断 , 极 少 直接 应 用 于 诊断 
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(Millar et al., 2019)。 对 于 计算 模型 应 用 于 预测 和 
评 佑 过程 管 理 的 功能 也 是 浅 学 辑 止 、 不 够 深入 。 
五 是 应 用 受众 对 模型 的 认可 度 仍 需 提 高 。 当 前 
ASD Tests .Cognoa 等 操作 简便 的 智能 识别 软件 已 
经 可 以 轻松 地 在 手机 端 下 载 获 得 ， 上 传 视频 或 完 
成 测试 题目 就 可 以 快速 获得 得 查 结果 ， 但 是 绝 大 
多 数 家 长 、 教 师 甚 至 是 相关 专业 从 业 人 员 并 不 了 
解 这 些 软件 。 即 使 家 长 等 相关 人 员 知 晓 这 些 施 测 
工具 ,关系 到 识别 尤其 是 “诊断 ”结果 ,对 于 工具 
的 认可 和 接受 程度 可 能 也 难以 达到 研究 者 预期 。 
对 比 传 统 方法 ,专业 医师 经 过 长 时 间 观 察 和 家 长 
访谈 ,结合 高 度 结构 化 量 表 慎重 考量 得 出 结果 ， 
仅 ADI-R 量 表 一 项 施 测 时 间 就 长 达 2.5 小 时 ,过 
程 蕴 含 大 量 自然 真实 环境 中 的 人 际 互 动 线索 (Abbas 
et al., 2020)。 机 器 学 习 模 型 在 缩短 施 测 时 间 的 同 
时 能 否 得 到 真实 有 效 的 数据 ， 预 先 设 定 的 训练 数 
据 是 否 能 完全 覆盖 测试 对 象 ， 评 估 结 果 如 何 解 释 ， 
评估 结果 如 何 应 用 于 后 续 干 预 与 康复 ,， 这些 都 是 
家 长 或 其 他 应 用 受众 会 关注 的 问题 。 随 着 机 器 学 
习 技 术 的 不 断 成 熟 ， 上 述 问 题 更 深入 的 思考 与 论 
证 将 有 助 于 加 快 推 进 理论 模型 向 实践 转化 的 步 
伐 。 未 来 研究 可 在 丰富 研究 对 象 和 优化 机 器 学 习 
算法 的 基础 上 ， 充 分 调研 不 同 受 众 的 实际 需求 与 
困扰 ,有 针对 性 的 解决 问题 ， 同 时 增加 对 理论 研 
究 成 果 的 宣 导 ,在 实践 中 不 断 加 深 理 论 模型 的 渗 
透 与 推广 。 
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Application of machine learning in early identification and 
diagnosis of autistic children 


HOU Tingting1， CHEN Xiao’, KONG Depeng’, SHAO Xiujun’, LIN Fengxun', LI Kaiyun' 
( School of Education and Psychology, University of Jinan, Jinan 250022, China) 
Ê School of Educational Technology and Science, Zhejiang University of Technology, Hangzhou 310023, China) 
C Qingdao Chenxing Experimental School, Qingdao 266000, China) 


Abstract: Early detection, early diagnosis and early intervention have been determined as the consensus of 
autistic children education and rehabilitation. However, both the limitations of traditional identification and 
diagnosis methods and the lack of professionals mostly caused the miss of the well-timed intervention in 
autistic children. Considering the advantages of machine learning (i.e., objectivity, accuracy, simplicity and 
flexibility), which has been gradually applied in different aspects of autistic education and rehabilitation, 
including early prediction, screening, diagnosis and evaluation, to improve this situation. Despite that, a 
series of limitations, such as research objects selection, classified data collection, theoretical model 
application, still exist. How to promote the construction of the tracking database of maternal and newborn 
pathophysiological information and establish a standardized model classification index system should be the 
focus of the future research. At the same time, researchers should pay more attention to the algorithm 
optimization and accelerate the transformation of the theoretical achievements of intelligent autism 
identification and diagnosis to practice. 


Key words: machine learning, autism, early identification and diagnosis, systematic review 
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